Table of Contents

    공분산 행렬이란?

    • 다변량 가우스 분포의 퍼짐과 변수 간 관계를 모두 수학적으로 정리한 것을 의미.
      • 각 변수들의 퍼짐(분산) + 서로의 관계(공분산) 를 담은 정리표 같은 것.

    공분산 행렬의 형태

    • 키와 몸무게 두 변수가 있을 때, 공분산 행렬은 아래처럼 생긴다. img.png
    • Var(키): 키의 분산 (키가 얼마나 퍼져 있는지)
    • Var(몸무게): 몸무게의 분산
    • Cov(키, 몸무게): 키와 몸무게가 함께 어떻게 변하는지 (공분산)
    • 참고: 공분산은 대칭이라서 위/아래가 똑같아!

    img_1.png

    • 키 분산 -> 100: 키가 대략 ±10cm 정도 퍼져 있다는 뜻 (표준편차 10)
    • 몸무게 분산 -> 64: 몸무게가 대략 ±8kg 정도 퍼져 있다는 뜻
    • 키, 몸무게 공분산 -> 70: 키가 클수록 몸무게도 커지는 경향이 있다는 뜻 (양의 공분산)
      (💡 양수 → 둘이 함께 증가 / 음수 → 한쪽이 커질 때 다른 쪽은 작아짐)
    • 양의 공분산이면 그래프의 기울기가 오른쪽 위로 기울어지고, 음의 공분산은 왼쪽 위 방향으로 기울어진다.

    📚 요약 정리

    • 분산 : 각 변수 혼자 퍼진 정도
    • 공분산 : 두 변수 간 "서로 커지거나 줄어드는 정도"
    • 공분산 행렬 : 이 모든 정보를 정리한 표